INFORMATIKA TÉTELEK


    Online adatbázisok

    Az online adatbázis-létrehozás első lépése a dokumentumok gyűjtése. Ez alatt az egyes, ún. szakintézmények egy vagy több szakterület irodalmát gyűjtését értjük. Ezután az összegyűjtött irodalmat feldolgozzák: meghatározott időközönként megjelenő ún. referáló lapokban közlik a primer irodalom bibliográfiai adatait, rövid tartalmi ismertetőit, melyekben a primer dokumentum által hordozott minden lényeges információ megtalálható melyet referátumnak nevezünk. A következő lépés az adatbázisok megjelenése a következőképpen: a 60-as évektől a referáló lapok többségét számítógéppel kezdték előállítani. Egy-egy referátum adataiból + a hozzá kapcsolódó információ-visszakeresést segítő keresőnyelvi eszközökből képződött a rekord; a referáló lapok számítógépes változataiból kialakultak az adatbázisok. Online szolgáltatók A 70-es évek közepétől kialakulnak az ún. online szolgáltató-központok (szolgáltatók). Ezek több adatbázist tartalmaznak, azokat egységesen kezelik, és az információ-visszakereséshez is egységes felületet kínálnak. Pl. Dialog, DataStar, STN. Fontos tisztázni néhány alapfogalmat is: Felhasználó: Az “ügyfél”; az a személy, aki részére az online keresést végezzük. Online session: A számítógép bekapcsolásától annak kikapcsolásáig tartó tevékenység. Keresőkérdés: A felhasználó által természetes nyelven megadott keresés. Keresési stratégia: A keresőkérdés olyan átalakított formája, mely az online tevékenység során használható. Keresőszavak: A keresési stratégia építőelemei. Nem nyelvtani értelemben vett szavak, több szóból álló kifejezések is lehetnek keresőszavak. Típusai: • Alfabetikus. • Numerikus. • Alfanumerikus. Az információk visszakeresésekor megkülönböztetjük az információkereső nyelvet (az adatbázisra jellemző) és a parancsnyelvet (a szolgáltatókra jellemző). Az információkereső nyelv fontos elemei a kötött tárgyszavak, melyek valamely fogalom szigorúan meghatározott, kötött kifejezése (-> tehát több szóból is állhat). A hierarchikusan szervezett deszkriptorok ún. strukturált szótárakban vannak összegyűjtve. Ezek legfejlettebb formája a tezaurusz. 1.) Adatbázisra jellemző osztályozási rendszerek Általában a referáló lapok által korábban kialakított osztályozási rendzser átvétele nyomán alakultak ki. Releváns találat: A keresőkérdésekre adott választ tartalmazó találat. Teljesség: A minél több releváns találat kihozatalára jellemző mutató. T = megtalált releváns dokumentumok száma / az adatbázisban lévő összes releváns dokumentum %. A visszakereső rendszer hatékonyságát mutatja meg. Pontosság: A megtalált releváns találatok arányára jellemző mutató. P = releváns találatok száma / az összes találat % T és P egymás reciprokai, egymás rovására növelhetők. A keresési stratégia kialakításakor el kell dönteni, hogy teljességre vagy pontosságra törekszünk-e? Szókapcsolatok, operátorok, csonkolás Az online keresés során az adatbázisból kiválasztunk olyan rekordokat, amelyek egy vagy több keresőszót tartalmaznak. Ezekből a rendszer halmazokat képez, amelyeket sorszámmal (vagy hivatkozási számmal) lát el. A hivatkozási számok segítségével a halmazok, de a keresőszavak között is különféle kapcsolatokat létesíthetünk ún. operátorok segítségével. Ezek típusai: Logikai operátorok: AND : Két v. több halmaz (pl. A és B) közös elemeinek (metszetének) meghatározására szolgál. Használatakor a sorrend közömbös, tehát A AND B megfelel B AND A-nak. OR : Két v. több halmaz összes elemének (uniójának) meghatározására szolgál. A sorrend itt is tetszőleges, A OR B ugyan azt az eredményt adja, mint B OR A. NOT : Az egyik halmaz elemeiből kizárja a másik halmaz elemeit. Használata körültekintést igényel, mert könnyen eredményezheti releváns rekordok elvesztését. A sorrend is lényeges, A NOT B más eredményt ad, mint B NOT A. Helyzeti operátorok: keresőszavak egymáshoz viszonyított előfordulásának meghatározására szolgálnak. Alkalmazhatóságuk, jelölésük parancsnyelvenként változik. Léteznek olyan operátorok is, amelyek azt fejezik ki, hogy a keresőszavak NE LEGYENEK a megadott kapcsolatban egymással. Számoperátorok: numerikus adatok (pl. dátum, olvadáspont, stb.) esetén alkalmazhatóak. Csonkolás: a rendszerek általában többféle csonkolást tesznek lehetővé. Főbb típusok (az STN jelölésével) : 1.) végtelen csonkolás (?) 2.) csonkolás megadott határok között (# : 0 vagy 1 karakter) 3.) csonkolás pontosan a megadott számú karakterre (! : pontosan 1) Az online keresés menete Az online keresés két fő fázisra osztható: előkészítésre és végrehajtásra. Ezek gyakran egybemosódnak, de mindkét fázis nagyon nagy odafigyelést igényel. Az előkészítés során a felhasználó és a keresést végző személy közös tevékenysége. A jó előkészítés alapfeltétele a sikeres keresésnek. Az esetek többségében az előkészítés hosszabb és nagyobb erőfeszítést igénylő tevékenység, mint a végrehajtás. Az előkészítés több fázisra bontható. • A keresőkérdés értelmezése: tisztázni kell a felhasználóval, hogy keresőkérdése alkalmas-e online keresésre. • Teljesség / pontosság előzetes meghatározása: a költségek, a várható dokumentumszám ismeretében meg kell beszélni a felhasználóval, hogy a teljesség és a pontosság milyen arányban legyen jelen a munka során. • Adatbázis(ok) és szolgáltató(k) kiválasztása: a fentiekből kiindulva és az alábbi szempontokat figyelembe véve kell meghozni a döntést: 1. Milyen az adatbázis minősége: A szakirodalom mekkora részét fedi le, mekkora időszakot dolgoz fel, abstractot ad-e, milyen operátorok használhatók, stb. 2. Mennyire ismerjük az adatbázis használatát; ha kevésbé, akkor milyen szintű dokumentáció segít az eligazodásban? 3. Milyen költségek jelentkeznek az adatbázis használata során?, stb. Az adatbázis(ok) kiválasztása után kell a szolgáltatót (vagy szolgáltatókat) kiválasztani, némileg hasonló szempontok szerint. Keresési stratégia megtervezése során a teljesség/pontosság előzetesen eldöntött viszonyát figyelembe véve meg kell határozni a keresendő fogalomköröket és azok határait, meg kell adni a keresőszavakat, el kell dönteni, hogy alkalmazunk-e csonkolást, ha igen, milyet, el kell dönteni, hogy alkalmazunk-e korlátozásokat, ha igen, milyet. Végrehajtás: ezután gyakorlatilag megkezdődik a második fázis, a végrehajtás. Az ennek során jelentkező problémák, nem várt eredmények azonban óhatatlanul szükségessé teszik, hogy visszatérjünk az előkészítő fázishoz.

    LETÖLTÉS